\rsec{Introdução}

\rssec{Motivação}

%%% O começo
A necessidade de organizar informação existe desde os tempos mais primórdios.
Estudos mostram que, na antiga biblioteca de Pergamum, os ``livros''
foram inventados após a falta de papiro vindo do Egito. Estes ``livros'' eram
mais fáceis de se manusear do que os pergaminhos de papiro e logo os
substituíram.

Atualmente, a internet revolucionou o mundo no que diz respeito à
criação e recuperação de informação. A quantidade de dados aumenta rapidamente,
de forma não organizada e muitas vezes com conteúdo equivocado, portanto seria
conveniente que houvesse alguma forma de classificar a confiabilidade das
informações, assim como sua relevância. Neste contexto, essa classificação se
torna altamente prioritária, tornando-a um excelente alvo de estudos de como
resolver este problema.

É possível perceber que, junto com a popularidade da internet, vieram mecanismos
de busca via web (Web Search Engines). Estes mecanismos se utilizam de diversos
métodos para classificar a importância relativa entre essas páginas e com isso
conseguir distinguir os conteúdos mais relevantes em uma busca, por exemplo.

Um dos métodos existentes para classificar páginas na Internet é o
\textbf{PageRank}, que classifica as páginas, atribuindo um valor (que
chamaremos de \textit{rank}) a cada uma delas, calculado a partir de sua
estrutura de links imersas na Internet.

Outro método que também classifica páginas web é o \textbf{HITS}, que tem muitas
semelhanças com o PageRank, no entanto, para cada página ele atribui dois
valores distintos.

\rssec{Objetivos}

Neste trabalho de formatura supervisionado, pretendemos estudar e implementar
métodos de classificação de conteúdo por popularidade, analisando aspectos
como características, performance computacional e sensibilidade a parâmetros.

Neste estudo, veremos dois algoritmos desta família: o \textit{PageRank} e o
HITS.
